producen a nivel nacional se transmiten luego a la provincia. Al momento de intentar contrastar esta
hipótesis haciendo uso del PBG y PBI, la misma pareciera no cumplirse. Se debe tener en cuenta que la
periodicidad es distinta en ambos casos ya que justamente el índice se crea porque no hay ninguna
estadística con esa periodicidad para la provincia. Para el caso del PBG y PBI ambas series tienen
variaciones que son bastante simultaneas. Quedaría como posible caso de estudio profundizar en el por
qué de este rezago al hacer el análisis mensual.
Finaliza aquí este último capítulo donde se desarrolló el índice que era objetivo del presente
trabajo, y en el cual se lograron captar los patrones de comportamiento propios de la economía local y su
relación con la actividad económica del país.
CONCLUSIONES
Para concluir el presente trabajo se expondrán algunas conclusiones sobre el tema y algunos
aspectos teóricos para resaltar. Un punto importante es la posibilidad de analizar la matriz de
correlaciones S de un cierto conjunto de variables y a partir de esta, determinar a priori si puede ser
potencialmente útil el ACP sin una pérdida de información significativa. Se supone que existen dos
variables iniciales, para un análisis gráfico simple. El primero de los casos que se puede dar es el de alta
correlación entre las variables. Entre más correlacionadas estén las variables, si se las graficara, la nube de
puntos formada se parecería más a una recta, por ende, menor sería el error de aproximar los datos a
dicha recta. Si, por ejemplo, la nube de puntos estuviera alrededor del eje X, es decir la recta tendría
pendiente igual a cero. En este caso lo que está pasando es que la variable Y tiene muy poca varianza. El
resultado del ACP para este caso va a ser que el subespacio principal va a ser el eje X, cuyo vector base es
. Esto quiere decir que el coeficiente que le se está asignando a los datos de la variable Y es cero,
se está eliminando esta variable. Este es el segundo caso de utilidad, cuando haya variables con varianza
muy bajas van a tener coeficientes muy cercanos a cero y
(en el caso extremo J es exactamente
igual a la varianza de Y, la perdida que existirá de información es la varianza de la variable que se está
eliminando). O sea que, observando la matriz S a priori se podría deducir que tanta pérdida de información
habría por reducir su dimensionalidad. Valores altos de correlaciones o valores bajos de varianzas
indicarían casos donde se podría aplicar ACP con muy poca pérdida de información.
Una visión alternativa para el uso del ACP sería como método de compresión de datos para ser
almacenados. Lo cual puede tener mucha utilidad para casos que, por la evolución de la tecnología, son
cada vez más comunes y donde la cantidad de datos es enorme. Se continua con el supuesto de dos series
iniciales (
). Inicialmente se tendrán dos series de N datos y el ACP dejará una sola serie de N
coordenadas. Si a esa serie de coordenadas la se la multiplica por el vector base da los N puntos que
nuevamente serán bidimensionales. Pero ahora todos sobre la recta que los ajusta, porque van a ser las
estimaciones de los valores iniciales. Visto para grandes cantidades de datos esto permitiría almacenarlos
solo con las series de coordenadas que tienen una dimensionalidad menor, en este caso la mitad, y la
matriz de coordenadas haría las veces de decodificador para volver a obtener la información inicial.